AI023
Giới thiệu về lập trình Triton
Thực hiện kernel đầu tiên của bạn: Cộng vector
Mục tiêu học tập
- Nhận diện các thành phần cốt lõi của một kernel CUDA sử dụng từ khóa __global__
- Triển khai phân bổ bộ nhớ thiết bị và truyền dữ liệu giữa Host và Device
- Tính chỉ số luồng toàn cục để ánh xạ các phần tử dữ liệu vào từng luồng GPU riêng biệt
- Thực thi và đồng bộ việc khởi chạy kernel song song bằng cấu hình lưới và khối